FILTER MODE ACTIVE

#бенчмарк кибербезопасности

Найдено записей: 1

#бенчмарк кибербезопасности20.06.2025

UC Berkeley представляет CyberGym: масштабный бенчмарк для оценки AI в кибербезопасности на реальных уязвимостях больших кодовых баз

UC Berkeley представил CyberGym — обширный бенчмарк для оценки AI-агентов на реальных уязвимостях в крупных программных проектах, раскрывающий возможности и ограничения современных моделей.